from onnxruntime.quantization import quantize_dynamic, QuantType
import sys
# 输入模型和输出路径

input_model = sys.argv[1]
output_model = sys.argv[2]
print("Input:" + input_model)
print("Output:" + output_model)
# 执行动态量化
quantize_dynamic(
    input_model,
    output_model,
    weight_type=QuantType.QInt8,  # 权重量化类型（UInt8/Int8）
)